AI safety
Mechanistic Interpretability for AI Safety -- A Review
大規模言語モデルにおける安全性の実現と方向性
Robust Intelligence
citadel AI
渋谷の牛タン屋で横にいたカップルとAI開発における演繹と帰納について
ChatGPT vs BERT:どちらが日本語をより理解できるのか?
オープンソースLLMの日本語評価結果 - W&Bローンチで誰でも再現可能に
lm-evaluation-harness
第95回 Machine Learning 15minutes! Hybrid 切り抜き
https://www.youtube.com/watch?v=w8M7DRVOR54